其他
OPPO 下一代大数据 AI 一体架构实践
导读 云厂商用存储吸引用户,进而提供上层 SaaS 服务。云原生弹性计算架构可提高调度效率,实现资源的自动弹性伸缩,优化资源利用。本文将展示OPPO 下一代大数据 AI 一体架构在功能云上的实践,希望为大家带来启发。
文章将围绕以下三点展开:1. 技术架构
2. 应用落地
3. 展望
分享嘉宾|付庆午 OPPO 大数据架构师
编辑整理|吴
内容校对|李瑶
出品社区|DataFun
01
1. 云原生计算架构
首先,弹性伸缩迟滞。上图中展示了资源的分配效率(不是真正的资源利用率和机器的物理利用率),以及资源弹性趋势图。可以看到,凌晨高峰时资源使用率瞬间变高,回收资源持续了很长时间,效率低,弹性差。 另外,编码机器选型固化。云上的机器基本都是 Intel 的 x86 机型,无论是 AWS 还是阿里云提出的 ARM 机型从单价上就便宜 20-30%,但是 EMR 产品不兼容 ARM 机型。 最后是调度算法固定。
2. Data&AI 一体化数据湖架构
数据秒级入湖,在公司内部替代了部分资源的使用,达到了降本的效果。 自动化管理,Iceberg 缺少一层服务层,业务需要自己管理。 兼容非结构化数据,我们做了一个 DAA Catalog 来兼容非结构化数据的管理。
应用落地
2. 机器学习训练数据加速
3. 混合云场景应用
展望
分享嘉宾
INTRODUCTION
付庆午
OPPO
大数据架构师
目前在 OPPO 数据架构组负责架构演进研发;Spark 开源 RSS 项目 Shuttle 发起人;曾供职去哪儿网大数据,阿里云 MC 团队。
往期推荐
vivo 超大数据规模分布式消息中间件架构演进实践
专利大模型的实践与知识问答探索
蚂蚁集团 EB 级大数据治理架构与实践
平安银行智能化数据安全分类分级实践分享
大语言模型对汽车行业的影响和实践探索
告别信息过载:大模型驱动的搜索与推荐,精准定位用户需求
阿里巴巴技术实践:BI+AI技术的融合与应用
官宣|Apache Paimon 毕业成为顶级项⽬,数据湖步⼊实时新篇章!
从0到1,聊聊货拉拉如何搭建数据指标体系
领域模型生产指南
点个在看你最好看
SPRING HAS ARRIVED